60 research outputs found

    Diffusion, methods and applications

    Full text link
    Tesis doctoral inédita leída en la Universidad Autónoma de Madrid, Escuela Politécnica Superior, Departamento de Ingeniería Informática. Fecha de lectura: junio de 2014Big Data, an important problem nowadays, can be understood in terms of a very large number of patterns, a very large pattern dimension or, often, both. In this thesis, we will concentrate on the high dimensionality issue, applying manifold learning techniques for visualizing and analyzing such patterns. The core technique will be Di usion Maps (DM) and its Anisotropic Di usion (AD) version, introduced by Ronald R. Coifman and his school at Yale University, and of which we will give a complete, systematic, compact and self-contained treatment. This will be done after a brief survey of previous manifold learning methods. The algorithmic contributions of the thesis will be centered in two computational challenges of di usion methods: the potential high cost of the similarity matrix eigenanalysis that is needed to define the di usion embedding coordinates, and the di culty of computing this embedding over new patterns not available for the initial eigenanalysis. With respect to the first issue, we will show how the AD set up can be used to skip it when looking for local models. In this case, local patterns will be selected through a k-Nearest Neighbors search using a properly defined local Mahalanobis distance, that enables neighbors to be found over the latent variable space underlying the AD model while we can work directly with the observable patterns and, thus, avoiding the potentially costly similarity matrix eigenanalysis. The second proposed algorithm, that we will call Auto-adaptative Laplacian Pyramids (ALP), focuses in the out-of-sample embedding extension and consists in a modification of the classical Laplacian Pyramids (LP) method. In this new algorithm the LP iterations will be combined with an estimate of the Leave One Out CV error, something that makes possible to directly define during training a criterion to estimate the optimal stopping point of this iterative algorithm. This thesis will also present several application contributions to important problems in renewable energy and medical imaging. More precisely, we will show how DM is a good method for dimensionality reduction of meteorological weather predictions, providing tools to visualize and describe these data, as well as to cluster them in order to define local models. In turn, we will apply our AD-based localized search method first to find the location in the human body of CT scan images and then to predict wind energy ramps on both individual farms and over the whole of Spain. We will see that, in both cases, our results improve on the current state of the art methods. Finally, we will compare our ALP proposal with the well-known Nyström method as well as with LP on two large dimensional problems, the time compression of meteorological data and the analysis of meteorological variables relevant in daily radiation forecasts. In both cases we will show that ALP compares favorably with the other approaches for out-of-sample extension problemsBig Data es un problema importante hoy en día, que puede ser entendido en términos de un amplio número de patrones, una alta dimensión o, como sucede normalmente, de ambos. Esta tesis se va a centrar en problemas de alta dimensión, aplicando técnicas de aprendizaje de subvariedades para visualizar y analizar dichos patrones. La técnica central será Di usion Maps (DM) y su versión anisotrópica, Anisotropic Di usion (AD), introducida por Ronald R. Coifman y su escuela en la Universidad de Yale, la cual va a ser tratada de manera completa, sistemática, compacta y auto-contenida. Esto se llevará a cabo tras un breve repaso de métodos previos de aprendizaje de subvariedades. Las contribuciones algorítmicas de esta tesis estarán centradas en dos de los grandes retos en métodos de difusión: el potencial alto coste que tiene el análisis de autovalores de la matriz de similitud, necesaria para definir las coordenadas embebidas; y la dificultad para calcular este mismo embedding sobre nuevos datos que no eran accesibles cuando se realizó el análisis de autovalores inicial. Respecto al primer tema, se mostrará cómo la aproximación AD se puede utilizar para evitar el cálculo del embedding cuando estamos interesados en definir modelos locales. En este caso, se seleccionarán patrones cercanos por medio de una búsqueda de vecinos próximos (k-NN), usando como distancia una medida de Mahalanobis local que permita encontrar vecinos sobre las variables latentes existentes bajo el modelo de AD. Todo esto se llevará a cabo trabajando directamente sobre los patrones observables y, por tanto, evitando el costoso cálculo que supone el cálculo de autovalores de la matriz de similitud. El segundo algoritmo propuesto, que llamaremos Auto-adaptative Laplacian Pyramids (ALP), se centra en la extensión del embedding para datos fuera de la muestra, y se trata de una modificación del método denominado Laplacian Pyramids (LP). En este nuevo algoritmo, las iteraciones de LP se combinarán con una estimación del error de Leave One Out CV, permitiendo definir directamente durante el periodo de entrenamiento, un criterio para estimar el criterio de parada óptimo para este método iterativo. En esta tesis se presentarán también una serie de contribuciones de aplicación de estas técnicas a importantes problemas en energías renovables e imágenes médicas. Más concretamente, se muestra como DM es un buen método para reducir la dimensión de predicciones del tiempo meteorológico, sirviendo por tanto de herramienta de visualización y descripción, así como de clasificación de los datos con vistas a definir modelos locales sobre cada grupo descrito. Posteriormente, se aplicará nuestro método de búsqueda localizada basado en AD tanto a la búsqueda de la correspondiente posición de tomografías en el cuerpo humano, como para la detección de rampas de energía eólica en parques individuales o de manera global en España. En ambos casos se verá como los resultados obtenidos mejoran los métodos del estado del arte actual. Finalmente se comparará el algoritmo de ALP propuesto frente al conocido método de Nyström y al método de LP, en dos problemas de alta dimensión: el problema de compresión temporal de datos meteorológicos y el análisis de variables meteorológicas relevantes para la predicción de la radiación diaria. En ambos casos se mostrará cómo ALP es comparativamente mejor que otras aproximaciones existentes para resolver el problema de extensión del embedding a puntos fuera de la muestr

    Analgesia en la embolización renal según producto, causa y grado de isquemia

    Get PDF
    Introducción. La embolización renal es un procedimiento empleado en patología urológica como el tratamiento de tumores, sangrado retroperitoneal o exclusión renal por patologías como la HTA maligna. Material y métodos. Estudio observacional retrospectivo transversal en el que se evalúan 48 embolizaciones entre los años 1990 y 2011. Se han estudiado diferentes pautas analgésicas y la necesidad de rescate analgésico en función de la causa, el producto empleado y grado de isquemia. Resultados. La indicación más frecuente fue la embolización de tumores (70.8%), siendo el tamaño medio de 8.07 cm. La mediana de tamaño tumoral que precisó analgesia de rescate fue de 9 cm. El 80% de los tratados con coils precisaron analgesia de rescate. Según el grado de isquemia, el 62.5% de las embolizaciones totales necesitaron rescate con opiáceos. Conclusiones. La embolización con coils y alcohol pudiera ser más dolorosa que con el uso de otros productos. La embolización completa, en la cual se provoca una isquemia total del riñón, parece ser más dolorosa que aquella parcial. Aquellos tumores de mayor extensión, provocan mayor isquemia y, por tanto, más dolor postoperatorio. El tramadol de forma pautada cada 8 horas iv parece que reduce el riesgo de dolor postoperatorio, sin necesidad de analgesia de rescate.Departamento de Anatomía Patológica, Microbiología, Medicina Preventiva y Salud Pública, Medicina Legal y ForenseMáster en Investigación en Ciencias de la Salu

    Estudio de calidad del control del dolor post-operatorio en la prostatectomía radical abierta: analgesia epidural lumbar continua versus analgesia intravenosa convencional

    Get PDF
    El cáncer de próstata (CaP) es el tumor sólido más frecuente en los varones, con 21000 nuevos casos al año en España. La prostatectomía radical es una opción terapeútica que se aplica en el 36% de los pacientes. En los casos en que se realiza mediante prostatectomía radical abierta (PRA) se ha recomendado la analgesia epidural lumbar continua (AELC) para aliviar el dolor post-operatorio, el cual se ha documentado como moderado-intenso. Si bien, recientemente, tras la aplicación de analgesia multimodal balanceada se ha cuestionado el uso rutinario de la AELC para esta indicación. Se ha contrastado la hipótesis: "la analgesia epidural lumbar continua con ropivacaína al 0,2% para el post-operatorio de la prostatectomia radical abierta produce una calidad analgésica y una satisfacción del paciente muy superiores a la analgesia intravenosa convencional". El objetivo principal es: evaluar la mejora de la calidad que puede aportar la analgesia epidural lumbar continua con ropivacaina al 0,2% sobre la analgesia intravenosa convencional, en el tratamiento del dolor y complicaciones del postoperatorio inmediato de la prostatectomía radical abierta (PRA), como fase inicial para el desarrollo del programa de mejora en la calidad asistencial. Los objetivos secundarios incluyen: el análisis y comparación del dolor (en reposo y movimiento), la satisfacción del paciente y la valoración de la enfermería, la necesidad de rescate analgésico (RA), la estancia hospitalaria y de las complicaciones post-operatorias y de cada técnica analgésica.Departamento de Biología Celular, Histología y FarmacologíaDoctorado en Investigación en Ciencias de la Salu

    Proyecto de plantación en superintensivo, con riego por goteo, en el término municipal de Quintanilla de Arriba (Valladolid)

    Get PDF
    El presente proyecto tiene por objeto la planificación, establecimiento y puesta en marcha de una plantación de olivos en el término municipal de Quintanilla de Arriba, provincia de Valladolid. La variedad principal que se implantará, será Arbequina. Esta variedad se caracteriza por su buen comportamiento en plantaciones de alta densidad, así como las características organolépticas que ofrece el aceite que se obtiene de sus aceitunas. La plantación se llevará acabo con un sistema de explotación superintensivo, con riego por goteo. La captación de agua, necesaria para el riego, se obtendrá de una balsa cercana a la parcela, que se abastece del embalse de Peñafiel. La finalidad de la producción de aceitunas, es la venta de estas a una almazara de la zona, para la obtención de aceite de oliva virgen extra.Grado en Ingeniería Agrícola y del Medio Rura

    Diffusion Maps for dimensionality reduction and visualization of meteorological data

    Full text link
    This is the author’s version of a work that was accepted for publication in Neurocomputing. Changes resulting from the publishing process, such as peer review, editing, corrections, structural formatting, and other quality control mechanisms may not be reflected in this document. Changes may have been made to this work since it was submitted for publication. A definitive version was subsequently published in Neurocomputing, VOL 163, (2015) DOI 10.1016/j.neucom.2014.08.090The growing interest in big data problems implies the need for unsupervised methods for data visualization and dimensionality reduction. Diffusion Maps (DM) is a recent technique that can capture the lower dimensional geometric structure underlying the sample patterns in a way which can be made to be independent of the sampling distribution. Moreover, DM allows us to define an embedding whose Euclidean metric relates to the sample's intrinsic one which, in turn, enables a principled application of k-means clustering. In this work we give a self-contained review of DM and discuss two methods to compute the DM embedding coordinates to new out-of-sample data. Then, we will apply them on two meteorological data problems that involve time and spatial compression of numerical weather forecasts and show how DM is capable to, first, greatly reduce the initial dimension while still capturing relevant information in the original data and, also, how the sample-derived DM embedding coordinates can be extended to new patterns.The authors acknowledge partial support from Spain's grant TIN2010-21575-C02-01 and the UAM{ADIC Chair for Machine Learning. The first author is also supported by an FPI{UAM grant and kindly thanks the Applied Mathematics Department of Yale University for receiving her during her visits

    Auto-adaptive multi-scale Laplacian Pyramids for modeling non-uniform data

    Full text link
    Kernel-based techniques have become a common way for describing the local and global relationships of data samples that are generated in real-world processes. In this research, we focus on a multi-scale kernel based technique named Auto-adaptive Laplacian Pyramids (ALP). This method can be useful for function approximation and interpolation. ALP is an extension of the standard Laplacian Pyramids model that incorporates a modified Leave-One-Out Cross Validation procedure, which makes the method stable and automatic in terms of parameters selection without extra cost. This paper introduces a new algorithm that extends ALP to fit datasets that are non-uniformly distributed. In particular, the optimal stopping criterion will be point-dependent with respect to the local noise level and the sample rate. Experimental results over real datasets highlight the advantages of the proposed multi-scale technique for modeling and learning complex, high dimensional dataThey wish to thank Prof. Ronald R. Coifman for helpful remarks. They 525 also gratefully acknowledge the use of the facilities of Centro de Computación Científica (CCC) at Universidad Autónoma de Madrid. Funding: This work was supported by Spanish grants of the Ministerio de Ciencia, Innovación y Universidades [grant numbers: TIN2013-42351-P, TIN2015-70308-REDT, TIN2016-76406-P]; project CASI-CAM-CM supported by Madri+d 530 [grant number: S2013/ICE-2845]; project FACIL supported by Fundación BBVA (2016); and the UAM–ADIC Chair for Data Science and Machine Learnin

    High wind and energy specific models for global production forecast

    Full text link
    This is an electronic version of the paper presented at the European Wind Energy Conference and Exhibition, held in Marseille on 2009High and low production regimes are in principle different enough as to warrant the use of regime–specific models for the prediction of wind energy production. The simplest way to identify them may be the use of concrete wind/production thresholds. The computation of these thresholds requires an estimate of the most likely future regime and in this work we consider both NWP wind speed forecasts and also the production forecasts of a global full operation range model. As we shall illustrate over the aggregated wind energy production of a very large area of Spain, a production threshold–based approach gives consistently better results than the alternative, wind speed based, procedure

    Diffusion maps and local models for wind power prediction

    Full text link
    The final publication is available at Springer via http://dx.doi.org/10.1007/978-3-642-33266-1_70Proceedings of 22nd International Conference on Artificial Neural Networks, Lausanne, Switzerland, September 11-14, 2012In this work we will apply Diffusion Maps (DM), a recent technique for dimensionality reduction and clustering, to build local models for wind energy forecasting. We will compare ridge regression models for K–means clusters obtained over DM features, against the models obtained for clusters constructed over the original meteorological data or principal components, and also against a global model. We will see that a combination of the DM model for the low wind power region and the global model elsewhere outperforms other options.With partial support from grant TIN2010-21575-C02-01 of Spain’s Ministerio de Economía y Competitividad and the UAM–ADIC Chair for Machine Learning in Modelling and Prediction. The first author is also supported by an FPI-UAM grant and kindly thanks the Applied Mathematics Department of Yale University for receiving her during a visit. The second author is supported by the FPU-MEC grant AP2008-00167. We also thank Red Eléctrica de España, Spain’s TSO, for providing historic wind energy dat

    EVALUATING FUNGI INDOOR PRESENCE IN HOMES THROUGH VIABLE AND NON-VIABLE SAMPLING

    Get PDF
    Moulds are common and important allergens. They are more abundant outdoors but patients affected by mould allergy stay indoors much longer than outdoors. So, indoor sampling could help to assess the influence of the concentration of allergens in allergic symptoms. The aim of this study was to assess the relative efficiencies of two air sampling methods, viable and non viable, for the quantification of airborne indoor fungi in the homes of patients sensitized to Alternaria. Furthermore, outdoor sampling was carried out to compare results. Samples were taken over six months in Badajoz (SW Spain). Two houses were selected according to the presence of allergic patients to Alternaria. They were sampled once a month using both viable and non viable personal samplers at solar noon. A Burkard personal sampler was used to record spores and a Sampl’air AES Chemunex sampler was used for colonies. Three rooms were selected in each home: living room, kitchen and bathroom. Temperature and relative humidity were registered at each sample. Outdoor sampling was performed one day per week at the Faculty of Science, using a seven day Burkard sampler for spores and the same personal sampler for colonies. On average, 200-300 CFU/ m3 were found from more than 40 taxa identified. The highest number of colonies was recorded in the kitchen, then in the bathroom and finally in the living room. Nevertheless, there were minor differences between rooms. The houses studied showed a similar temporal pattern, with maximum values in December and minimum in January. Cladosporium colonies showed statistical differences between homes, but these differences were not found with Alternaria, Aspergillus or Penicillium colonies. Differences between rooms appeared for Alternaria colonies and Cladosporium herbarium spores. Temperature was positively correlated in most cases and relative humidity negatively with Alternaria spores. The number of spores collected was as twice as that of colonies, with an average concentration between 600-700 colonies/m3 , and nearly 1400 spores/m3 as maximum concentration. The temporal pattern of spores was similar to that found for colonies. Comparing colonies to spores, Alternaria and AspergillusPenicillium showed similar values. Notwithstanding, Cladosporium spores were nearly five times more abundant than colonies. The advantage of viable methods is the identification to species level, but they have the disadvantage that spores from some ubiquitous species, as Cladosporium, do not always grow in those media, which raises the interest to use additional non-viable methods
    corecore